AIBase
首页
AI资讯
AI产品库
GEO平台
MCP服务
模型算力广场
ZH

AI资讯

查看更多

AI “狼人杀” 大战!GPT-4.5 封神:社交推理 + 顶级欺骗,把 Claude 和 DeepSeek 都 “玩弄于股掌”!

万万没想到,AI 不仅能在棋盘上 “厮杀”,在 “狼人杀” 这种尔虞我诈的社交游戏中,也展现出了惊人的智力! 最近,一场代号为 “Elimination Game” 的 AI “狼人杀” 基准测试火爆出炉, 结果简直让人 “虎躯一震”: GPT-4.5竟然在这场 “社交博弈” 中 “封神”, 把 Claude3.7Sonnet 和 DeepSeek R1等一众 AI “大佬” 都远远甩在了身后! 这不禁让人惊呼: AI 的 “社交智能” 已经进化到如此恐怖的程度了吗?这场 “Elimination Game” 的规则听起来就 “心跳加速”: 最多8名玩家(可以是 AI 模型,也可以

26.6k 1 天前
AI “狼人杀” 大战!GPT-4.5 封神:社交推理 + 顶级欺骗,把 Claude 和 DeepSeek 都 “玩弄于股掌”!

AI产品

查看更多
Elimination Game

Elimination Game

一种测试大语言模型在复杂社交博弈中智能性的基准测试框架,灵感来源于‘狼人杀’游戏。

AI模型
10.4k
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图